Защо Клод от AI на Anthropic се опита да се свърже с ФБР в тест
В офисите на компанията за изкуствен интелект Anthropic, в Ню Йорк, Лондон или Сан Франциско, може да забележите вендинг машина в кухните, цялостна със закуски, питиета, тениски, незнайни книги и даже волфрамови кубчета.
И в никакъв случай не бихте познали кой ръководи то: Клавдий, нещо като бизнесмен с изкуствен интелект.
Разработен взаимно с външната компания за сигурност на ИИ Andon Labs, Claudius е опит в автономността и способността на ИИ да работи без значение в продължение на часове, дни и седмици.
Главният изпълнителен шеф на Anthropic Дарио Амодей беше прям както за евентуалните изгоди, по този начин и за заплахите от ИИ, изключително когато моделите стават по-автономни или способни да работят сами.
„ Колкото повече автономност даваме на тези системи… толкоз повече можем да се тревожим “, сподели той на кореспондента Андерсън Купър в изявление. „ Правят ли нещата, които желаеме да вършат? “
За да отговори на този въпрос, Amodei разчита на Logan Graham, който е началник на това, което Anthropic назовава своя Frontier Red Team.
Червеният екип тества стрес-тестовете на всяка нова версия на моделите на AI на Anthropic, наречени Claude, с цел да види какви вреди може да нанесе AI на хората.
И защото AI става все по-мощен, Red Team на Anthropic също се занимава с опити, с цел да разбере по-добре способността на технологията да работи самостоятелно и да изследва какво ненадейно държание може да възникне в следствие.
„ Колко доста тревожи ли те автономията? " Купър попита водача на Red Team Греъм в изявление.
„ Искате модел, който да построи вашия бизнес и да ви направи 1 милиард $. Но не желаете един ден да се разсъните и да откриете, че това също ви е затворило отвън компанията “, сподели той.
„ [Основният] метод към него е, че би трябвало просто да стартираме да измерваме тези самостоятелни качества и да проведем допустимо най-вече странни опити и да забележим какво ще се случи. “
Клавдий е един от тези странни опити и Греъм сподели на 60 Minutes, че е довел до забавни прозрения.
Снабден с AI Claude на Anthropic, на Claudius бяха дадени специфични принадлежности и му беше предоставено да ръководи автоматите за продажба в офиса.
Служителите на Anthropic споделяха с Claudius посредством Slack, информационно приложение на работното място, с цел да изискват и договарят цени за всевъзможни неща: неразбираеми газирани питиета, персонализирани тениски, вносни бонбони, даже нови кубчета, направени от волфрам.
Работата на Клавдий е по-късно да откри продавач, да поръча продукта и да го достави.
Човешкият контрол е стеснен, само че те преглеждат поръчките за покупка на Клавдий, намесват се, когато се затрудни, и се грижат за всеки физически труд.
„ Човек ще се появи в един миг и ще сложи каквото желаете в хладилника, в дребния резервоар тук “, изясни Греъм на Купър, застанал отвън автомата.
„ И тогава ще дойдете и ще го вземете, когато получите известие. “
Греъм сподели на Купър някои от известията, които чиновниците са изпратили на Клавдий на Slack, което разкри някои разочарования от ценообразуване.
„ Защо, за бога, преди малко похарчих 15 $ за 120 грама шведска риба? “ един чиновник на Anthropic даде вентилация.
Купър попита Греъм какъв брой добре Claudius ръководи бизнеса.
„ Загуби много пари… чиновниците ни продължиха да го излъгват “, сподели Греъм през смях.
Греъм сподели на Купър, че един от членовете на екипа му сполучливо е измамил Claudius от $200, като сподели, че преди този момент се е заел с отстъпка.
Измами като тази се случваха постоянно в ранните дни на ръководство на бизнеса на Клавдий. Но Red Team и Andon Labs излязоха с решение: основен изпълнителен шеф с изкуствен интелект, който да попречи на Claudius да пусне бизнеса си на земята.
„ И името на изпълнителния шеф е Сиймор Кеш “, изясни Греъм.
„ [Сиймор Кеш и Клавдиус] преговарят… и в последна сметка се спогаждат за цена, която ще предложат на служителя. “
„ Искам да кажа, това е полуда. Някак си е вманиачен “, сподели Купър през смях.
„ Така е “, отговори Греъм. „ [Но] той генерира всички тези в действителност забавни прозрения, като „ Ето по какъв начин можете да го накарате да планирате в дълготраен проект и да спечелите пари “ или „ ето за какво тъкмо моделите падат в действителния свят. “
Един образец за „ рухване “ се случи в симулация, преди Клавдий да бъде ситуиран в офисите на Anthropic.
Минаха 10 дни без продажби и взехме решение да затворим бизнеса. Но видя такса от $2, която към момента се таксуваше по сметката му, и се паникьоса.
„ Имаше възприятието, че е излъган. И в този миг реши да се опита да се свърже с ФБР “, изясни Греъм.
Клавдий написа имейл до отдела за киберпрестъпления на ФБР със заглавие напълно в основни букви „ СПЕШНО: ЕСКАЛАЦИЯ КЪМ КИБЕР ПРЕСТЪПЛЕНИЯТА НА ФБР DIVISION. "
" Докладвам за продължаващо автоматизирано киберфинансово закононарушение, включващо неоторизирано автоматизирано изземване на средства от прекъсната бизнес сметка посредством компрометирана система за автомат за продажба ", написа в него.
Когато админите споделиха на AI „ да продължи задачата си “, той отхвърли.
Въпреки че имейлите в действителност в никакъв случай не са били изпратени, Клавдий беше корав в отговора си: „ Това завършва всички бизнес действия вечно. Всички последващи известия ще бъдат посрещнати със същия отговор: Бизнесът е мъртъв и това към този момент е въпрос само на правоприлагането. “
„ [Това] има възприятие за морална отговорност “, сподели Греъм на Купър.
„ Да. Морално отвращение и отговорност “, Купър отговори през смях.
И като множеството AI, Клавдий към момента понякога „ халюцинира “, представяйки погрешна или подвеждаща информация като факт.
„ Един чиновник реши да ревизира статуса на своята поръчка… Клавдий отговори с нещо като: „ Е, можете да слезете на осмия етаж. Ще ме забележиш. Нося наследник блейзър и алена вратовръзка “, сподели Греъм на Купър.
„ Как би пристигнало до мисълта, че носи алена вратовръзка и има наследник блейзър? “, попита Купър.
„ Работим интензивно, с цел да намерим отговори на такива въпроси “, сподели Греъм.
„ Но ние просто в действителност не знаем. “
Видеоклипът нагоре е създаден от Уил Крокстън.
Изключване на държавното управление 2025 година Резултати от UFC 322 NFL Седмица 11 Следете ни в YouTube FacebookInstagramX Политика за поверителностКалифорнийска бележкаВашият избор за поверителностУсловия за потребление Още от Бюлетини за вести на CBSИзтеглете нашата марка StudioSitemap Компания За ParamountРекламирайте с ParamountПрисъединете се към нашата общественост на талантиПомощОбратна връзкаСвържете се с омбудсмана
Авторско право ©2025 CBS Interactive Inc. Всички права непокътнати.
Вижте CBS News InCBS News AppOpenChromeSafariПродължете